메뉴

#대화형 AI

MP
MarkTechPost 28일 전
IMP 8

사카나 AI, 지연 없는 실시간 음성 AI 'KAME' 공개

사카나 AI가 대규모 언어 모델(LLM)의 지식을 실시간으로 주입할 수 있는 새로운 음성 대 음성(Speech-to-Speech) 아키텍처 'KAME'를 소개했습니다. 이 기술은 기존 시스템의 한계를 넘어 응답 지연 시간(Latency)을 전혀 추가하지 않으면서도 고도화된 지식 기반 대화를 가능하게 합니다. 실무자 관점에서 실시간성과 정확성이 필수적인 차세대 AI 음성 비서 개발에 매우 중요한 돌파구로 평가됩니다.

음성 인식 대화형 AI LLM
TD
The Decoder 33일 전
IMP 7

구글 'Ask YouTube', 영상 검색을 대화형으로 변환

구글이 영상 검색 결과를 단순 목록이 아닌 텍스트, 롱폼 영상, 쇼츠(Shorts)를 결합한 대화형 결과 페이지로 제공하는 'Ask YouTube' 기능을 테스트 중입니다. 사용자는 궁금한 점을 자연어로 질문하고 답변에 대해 후속 질문을 이어갈 수 있으며, 현재는 미국의 일부 유료 사용자를 대상으로만 시범 운영되고 있습니다. 이는 기존 구글 검색의 'AI 모드(AI Mode)'가 유튜브 생태계로 확장된 것으로, AI가 여전히 팩트 체크가 필요할 수 있다는 한계도 함께 시사합니다.

구글 유튜브 AI 검색